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Prediction of Corporate Bankruptcy in the 
Agro-industrial Sector of Machala City 


Resumen 

En el presente trabajo se propone un modelo de predicción de quiebra empresarial 
para las organizaciones agroindustriales domiciliadas en la ciudad de Machala, Ecuador. 
Para la construcción del modelo se consideró una población de 311 empresas listadas 
en el portal de información de la Superintendencia de Compañías del Ecuador (SC) y 
13 de los 20 indicadores financieros reportados por el mismo ente, los cuales fueron 
seleccionados por medio de un análisis de correlación. Dado que el problema de 
predicción de quiebra suele ser desbalanceado por naturaleza (hay más empresas 
activas que inactivas en los datos), se utilizó un muestreo aleatorio simple en la base 
de empresas activas para igualar en cantidad a la base de empresas inactivas. Como 
resultado, el modelo de predicción de quiebra, basado en árboles de decisión, tiene una 
confiabilidad/precisión del 78,57 %, la cual es aceptable en comparación con la de otros 
modelos propuestos en la literatura. Finalmente, el modelo se aplicó en el ejercicio fiscal 
2018 obteniendo una alerta temprana para 190 empresas de la rama en estudio, lo cual 
sugiere un revisión minuciosa de su situación contable-financiera para evitar posibles 
problemas futuros y salvaguardar la economía de la región y las plazas de trabajo que 
estas compañías proveen. 


Palabras clave: Analíticas de Negocios, Modelos de predicción, Árboles de decisión, 
Finanzas. 


Abstract 

n this paper, a corporate bankruptcy prediction model is proposed for agro-industrial 
organizations domiciled in the city of Machala, Ecuador. We built the model considering 
a population of 311 companies in the Superintendencia de Compañías del Ecuador 
SC) information portal and 13 of the 20 financial ratios reported by the same entity, 
selected through a correlation analysis. Since the bankruptcy prediction problem tends 
o be unbalanced (there are more active than inactive firms in the data), simple random 
sampling on the active firm base was used to equate quantity to the inactive companies 
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base. As a result, the prediction model based on decision trees has a reliability/accuracy 
of 78.57%, which is acceptable compared to other models proposed in the literature. 
Finally, the model was applied in the 2018 fiscal year, obtaining an early warning for 
190 companies in the branch under study. This suggests a thorough review of their 
accounting-financial situation to avoid possible future problems and safeguard the 
region's economy and the jobs these companies provide. 


Keywords: Business Analytics, Prediction models, Decision trees, Finance. 


INTRODUCCIÓN 


El Ecuador es un país con condiciones agroecológicas únicas, lo cual ha facilitado la 
producción y exportación de bienes primarios [1]. Entre las provincias más ricas en 
recursos naturales se encuentra El Oro. A la riqueza de sus tierras, donde tradicionalmente 
se ha producido banano, cacao, café, camarón, entre otros, se añaden dos elementos 
de especial importancia: un grupo poblacional joven en edad económicamente activa 
y un clima que favorece la producción de bienes del sector primario, otorgándole a 
a región ventajas comparativas y competitivas sobre otras provincias del país. A pesar 
de la importancia que tiene la provincia para el desarrollo del Ecuador, existen pocas 
investigaciones que describan su tejido empresarial, así como la estructura financiera y 
de gestión comercial de las organizaciones que hacen vida en ella [2]. 


La quiebra empresarial es un problema importante para la economía de las naciones. Las 
crisis financieras que suelen presentarse de forma paulatina cada cierto tiempo, llevan a 
as empresas a reaccionar de forma inmediata frente a los cambios en los entornos del 
mercado donde operan, pues de otra manera corren el riesgo de deteriorar su situación 
financiera y provocar su quiebra. Los gerentes se ven abocados por un gran volumen de 
datos, información y a un sinfín de posibilidades para el diseño y análisis de escenarios. 
Esta diversidad de enfoques y herramientas hacen necesario seleccionar una técnica 
que identifique de forma acertada el deterioro de los estados financieros, permitiendo la 
formulación y ejecución de políticas que garanticen la supervivencia de la empresa [3]. 
Dado el movimiento que las empresas generan en la economía de un país, es necesario 
que tanto inversionistas como organismos estatales cuenten con herramientas 
adecuadas de predicción de la posibilidad de quiebra de una compañía, de tal manera 
que se puedan tomar acciones correctivas a tiempo y evitar que la bancarrota afecte 
tanto a los trabajadores como a la economía de la nación. 


En la literatura, existen varios modelos basados en numerosas técnicas cuantitativas para 
estudiar la quiebra empresarial, entre los cuales destaca el famoso modelo de Altman [4, 
5]. Posterior a este, numerosos modelos similares han sido propuestos utilizando como 
mecanismo principal el análisis discriminante multivariado [6-9]. Las principales diferencias 
de estas propuestas radican en las variables predictoras usadas para construir el modelo 
de clasificación, el tamaño de la muestra, el país y el sector económico de estudio, entre 
otras características [4, 10, 11]. Al disponer de herramientas financieras cuantitativas 
como lo son los modelos de predicción de bancarrota empresarial, los inversionistas y 
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los organismos de control pueden estimar hasta con cinco años de anticipación el riesgo 
potencial de quiebra que tiene una organización, de tal forma que se pueda alertar a esta 
para que ejecute planes de acción para salir de dicha posible crisis futura. Por lo anterior, se 
hace necesario en nuestro país la investigación y desarrollo de estas herramientas. 


El objetivo del presente trabajo es aplicar los árboles de decisión para construir un modelo 
de predicción de quiebra empresarial para el contexto ecuatoriano, específicamente, 
para el sector de las empresas agroindustriales domiciliadas en la ciudad de Machala, 
provincia de El Oro. Para esto se toma como base la revisión de la literatura, tanto a nivel 
nacional como internacional, de los diferentes modelos disponibles. Esta investigación 
aporta información útil para empresas de otros sectores que en el futuro deseen adaptar 
modelos de predicción de quiebra e implementar medidas correctivas que las beneficien, 
y así disminuir la posibilidad que se generen problemas que las lleven a la bancarrota. 


El resto del documento se encuentra estructurado de la siguiente manera: En la Sección 
Fundamentos teóricos y revisión de la literatura se presenta el marco teórico junto con 
los trabajos recientes relacionados con los modelos de predicción de quiebra tanto 
en el ámbito internacional como nacional. La Sección Metodología presenta el diseño 
metodológico de la investigación, la obtención de los datos, selección de variables y el 
método para modelar la quiebra. Por su parte, en la Sección Modelo de predicción de 
quiebra propuesto se desarrolla el nuevo modelo de predicción de quiebra, se analiza su 
desempeño y se presenta un caso de aplicación para ejercicio fiscal 2018. Finalmente, la 
Sección Conclusiones y trabajo futuro presenta las principales conclusiones obtenidas 
con el estudio y discute algunas ideas para trabajo futuro. 


FUNDAMENTOS TEÓRICOS Y REVISIÓN DE LA LITERATURA 
La quiebra empresarial 


La quiebra de las empresas es un problema muy relevante en el mundo contemporáneo, 
no solo por las distintas recesiones económicas que han afectado a los países en los 
últimos cien años, sino por situaciones fortuitas como desastres naturales locales o 
a mayor escala, casos como la emergencia sanitaria presentada por el Covid-19. Esto 
último ha conllevado a las empresas a confrontar innumerables dificultades que han 
provocado reducción de ventas y sueldos, aumento del desempleo y del subempleo 
12] y lamentablemente, la quiebra de varias de estas. Según la Comisión Económica 
para América Latina y el Caribe [13], la quiebra de empresas es una consecuencia a 
mediano y largo plazo considerado dentro de los costos económicos del Covid-19, por 
o que los países han impulsado estímulos fiscales para impedir la quiebra generalizada 
en sus territorios [14, 15]. En Ecuador, las medidas buscan disminuir la insolvencia para 
evitar la quiebra [16]. A pesar de que empresas estatales como Tame EP [17] o Correos del 
Ecuador EP [18] ya se encuentran en proceso de liquidación; existen otras organizaciones 
que debido a la paralización pueden presentar pronta quiebra y generar una cadena por 
desabastecimiento de materia prima y servicios en sus procesos productivos [19]. 


En concordancia con el problema que sugiere la quiebra empresarial, existe el 
permanente interés que esto representa para un amplio conjunto de agentes 
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económicos, políticos y sociales [20]. Desde la introducción del 


érmino en 1966, 


varias definiciones similares han sido propuestas en la literatura, tales como quiebra, 
bancarrota, fragilidad, entre otras. Las referencias [20] y [21] presentan una larga lista 
de definiciones acuñadas desde la introducción del tema en 1966. En la Tabla 1, de 
elaboración propia, se muestra la actualización de dichos conceptos hasta la fecha. De 
manera general, se puede decir que la quiebra de una empresa constituye un estado de 
crisis de su actividad económica, lo cual impide el cumplimiento de sus obligaciones 
financieras, representando así, un desequilibrio entre los valores realizables y las 


prestaciones exigibles. 


Tabla 1. Definiciones de quiebra empresarial 2014 - presente 


Término Defi n 


Quiebra Procedimiento legal, mediante el cual 
se declara al deudor incapacitado 
para cumplir con sus obligaciones 

financieras, debido a su insolvencia. 


Quiebra Falta de solvencia. 


Insolvencia Situación en la que la empresa no 
puede atender sus pagos por razones 
de tesorería, depreciación de activos, 

vaciamiento de liquidez en los 
mercados financieros, etc. 


Quiebra Falta de liquidez causada en su gran 
mayoría por la ausencia o retraso en los 
pagos y la disminución en el consumo. 


Quiebra Según la ley española, se presenta 
cuando el deudor no es capaz de 
cumplir con sus obligaciones exigibles 
de manera regular, lo cual obliga a las 
empresas a pasar por un proceso sea 
concursal (concurso de acreedores) o 
por una liquidación voluntaria. 


Insolvencia, fracaso o Presentan signos de vulnerabilidad 
quiebra financiera y se contraponen al 
concepto de empresas sanas o sin estas 
dificultades. 
Quiebra, Liquidación. La quiebra es un proceso donde el 


deudor inicia una moratoria en los 
pagos y trata de lograr un acuerdo 
de bancarrota. La liquidación es un 
proceso en el cual se busca pagar a los 
acreedores por medio de la disolución 
del deudor sin sucesión conforme a 
la ley. 


Fuente: Elaboración propia 
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Como se puede apreciar en la Tabla 1, la evolución de la conceptualización de la 
quiebra empresarial mantiene el hilo conductor presentado en [21], que corresponde 
a la imposibilidad de la organización para cumplir con sus responsabilidades y pagos, 
empleando en su mayoría los términos quiebra o fracaso. Los autores definen la quiebra 
desde las perspectivas judiciales, financieras o económicas del país de estudio. Desde 
el punto de vista legal, corresponde a la bancarrota o quiebre legal [29]. La perspectiva 
financiera se relaciona con la falta de solvencia o liquidez para cubrir las deudas tal como lo 
exponen en las referencias [29-31]; mientras que desde la perspectiva económica, la quiebra 
es cuando la empresa tiene patrimonio neto negativo, el cual es insuficiente para cubrir sus 
costos [29]. En las referencias [32] y [33], se define el concepto con base en dichos síntomas. 
En esta categoría, la quiebra supone un estado de crisis que no le permite continuar a 
la empresa con sus actividades por el incumplimiento a sus obligaciones financieras; sin 
embargo, no necesariamente considera el cierre o cese de operaciones [21]. 


En este trabajo de investigación la definición de quiebra empresarial que se acoge es la 
planteada en la referencia [28] por ser la que más se asemeja al contexto legal en Ecuador. 


Modelos de quiebra empresarial 


Entre los primeros modelos de predicción de quiebra empresarial se encuentra el 
desarrollado por Beaver [34], quien descompuso varios ratios financieros a través de 
herramientas estadísticas como el análisis univariante, el análisis de varianza y el test 
dicotómico. El autor indica que el ratio entre el flujo de caja resultante y la deuda de la 
empresa es un indicador muy confiable en la determinación de la solvencia y liquidez 
de las organizaciones. Posteriormente, Altman [4] propone un nuevo modelo el cual 
calcula una puntuación que predice la posibilidad de quiebra de una compañía durante 
los próximos cinco años, utilizando como técnica estadística el análisis discriminante 
multivariado [111]. 


Por otra parte, Olhson [35] fue uno de los primeros autores en utilizar un método 
estadístico diferente a los que anteriormente se habían utilizado para predecir la 
probabilidad de quiebra de las empresas. Su metodología se basó en el desarrollo de un 
modelo econométrico de probabilidad condicional con base en la regresión logística. 
El principal hallazgo de su estudio fue que es posible identificar cuatro factores básicos 
estadísticamente significativos que afectan la probabilidad de quiebra: (1) el tamaño 
de la empresa, (2) una o varias medidas de la estructura financiera, (3) las medidas del 
desempeño y (4) las medidas de liquidez actuales. 


Posterior al trabajo presentado por Altman, varios modelos de predicción de quiebra 
han sido propuestos en la literatura utilizando el enfoque del análisis discriminante 
multivariado [6-9], los cuales se diferencian principalmente por las variables predictoras 
usadas para construir el modelo, el tamaño de la muestra, el país y sector económico 
de estudio, entre otras características. Así mismo, otro método estadístico utilizado en la 
construcción de modelos de predicción de quiebra empresarial es la regresión logística, 
tal como se muestra en las referencias [10, 36, 37]. En estos trabajos, los autores realizan 
una comparación exhaustiva de los modelos existentes, no sólo del área estadística, sino 
también de otras áreas matemáticas y de las ciencias computacionales. Por ejemplo, 
una de las áreas que ha ganado mucha acogida en los últimos años, en especial por 
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el aumento considerable del poder de procesamiento de los computadores, es la 
inteligencia artificial o“machine learning” [38, 39]. Los modelos de predicción de quiebra 
corporativa derivados de esta comunidad científica están basados principalmente en 
Support Vector Machines [40] y Árboles de Decisión [41]. En el presente documento 
mencionaremos únicamente los modelos basados en árboles de decisión [27, 42-47]. 


El primer modelo de predicción de quiebra basado en árboles de decisión fue propuesto 
por Frydman [43]. El objetivo de dicho trabajo fue proponer un modelo no paramétrico 
que combine los enfoques de análisis univariado y multivariado, para mejorar su 
rendimiento en comparación de aquellos generados con el análisis discriminante. 
Como resultado, la precisión fue superior a los principales métodos de la época tales 
como el Z-Score de Altman y el modelo de Beaver. Posteriormente, Gepp [44] investigó 
más a fondo las ventajas y desventajas que existen al generar modelos de predicción 
de quiebra usando árboles de decisión, pero esta vez usando distintos algoritmos para 
su construcción. Como resultado se obtuvo que los árboles de decisión pueden tener 
mejor rendimiento en comparación con las técnicas estadísticas tradicionales. 


Por otra parte, Blanco [42] propone un modelo híbrido con base en la regresión logística 
y los árboles de decisión, el cual obtiene un mejor desempeño en comparación con 
aquellos generados de forma aislada con cualquiera de las dos técnicas. De esta manera 
busca explotar las ventajas de los métodos paramétricos y no paramétricos en la 
predicción de la quiebra empresarial. Finalmente, Caro [27] propone varios modelos de 
predicción de quiebra para varias economías de América Latina, entre ellas Chile, Perú 
y Argentina. Como resultado se obtuvo que los indicadores financieros más relevantes 
para la predicción de la quiebra varían en función del país. 


Como se puede apreciar, el área de predicción de quiebra empresarial tiene mucha 
relevancia a nivel internacional, lo cual se ve justificado por la gran cantidad de trabajos 
de investigación de diferentes comunidades científicas dirigidos a la creación de 
modelos de predicción de quiebra [10, 36, 48]. Por otro lado, en Ecuador no existen 
muchos estudios realizados con el enfoque de desarrollar modelos de predicción de 
la quiebra empresarial. Los trabajos más recientes en esta línea son aquellos de las 
referencias [49-51]. 


Por su parte, Morales [49] propone un modelo de predicción de quiebra para el entorno 
ecuatoriano utilizando empresas del sector agrícola. Para la elección de la técnica de 
modelado, comentó sobre tres posibilidades: redes neuronales, regresión logística y el 
Z-score de Altman. Basado en el hecho de que este último es el más fácil de entender 
y desarrollar, implementa en SPSS un Z-score para Ecuador utilizando la información 
de la Superintendencia de Compañías. La principal deficiencia de este trabajo es el 
hecho que no se hace una selección objetiva de la técnica de modelado, ni se valida la 
precisión del modelo propuesto. 


Por otro lado, Chávez [50] desarrolla un modelo Probit y un modelo Logit para medir la 
fragilidad de las empresas ecuatorianas. Para ello utilizan un total de 22854 empresas 
listadas en la Superintendencia de Compañías en el año 2013. Los resultados arrojaron 
que el retorno sobre la inversión (ROA), el retorno de la empresa (ROE) y la liquidez son 
los factores predominantes a la hora de estimar la fragilidad de una empresa. A pesar 
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de que su muestra no hace distinción de sectores industriales, la cantidad de empresas 
declaradas en quiebra durante el periodo de estudio es aproximadamente el 2 % del 
tamaño total de la muestra. Esto produce que los modelos sean construidos utilizando 
una base de datos sesgada hacia las empresas que aún se encuentran operativas. 
Es decir, el modelo tendrá más posibilidad de medir la fragilidad de empresas bien 
constituidas que aquellas que no lo están. 


Finalmente, Cueva [51] propone un modelo basado en análisis discriminante para 
determinar cuáles son los ratios financieros que influyen significativamente en la 
gestión del riesgo financiero de las empresas de la séptima región del Ecuador. Para la 
construcción del modelo se utilizó una muestra de 71 empresas manufactureras y como 
variables predictoras se consideraron 12 ratios financieros. Los resultados mostraron que 
la liquidez, la rentabilidad del activo total, el apalancamiento total y la rentabilidad del 
patrimonio son los factores más importantes a la hora de determinar el riesgo de las 
industrias. Como se puede apreciar, la investigación considera un reducido tamaño de 
la muestra, la sectorización de esta y no valida los resultados obtenidos. 


En resumen, se puede observar que los trabajos de investigación orientados al análisis 
y predicción de la quiebra empresarial en el Ecuador cuentan con varias oportunidades 
para su mejora y extensión. Por esto, es necesario que se realicen nuevas investigaciones 
que las exploten, puesto que un adecuado análisis de los riesgos de bancarrota de 
las compañías ecuatorianas podrían aportar conocimientos importantes a la hora de 
diseñar políticas públicas de apoyo a las empresas que se encuentran dentro de este 
perfil de riesgo. 


Árboles de Decisión 


Los árboles de decisión (DT) son modelos de predicción utilizados en diversos ámbitos 
que permite estimar distintas alternativas facilitando la toma de decisiones. Mediante 
una base de datos, se elaboran diagramas de construcción lógica similares a los sistemas 
de predicción basados en reglas [52], que sirven para representar y categorizar una 
serie de condiciones que ocurren de forma sucesiva en la resolución de un problema. 
Su objetivo principal es clasificar una observación dentro de una categoría específica, 
similar a los modelos de análisis discriminante y de regresión logística [52, 53]. 


Una de las ventajas de utilizar un árbol de decisión con respecto a otros métodos es la 
posibilidad de combinar varias técnicas para obtener predicciones más robustas con un 
coste computacional más bajo. Así mismo, su estructura permite analizar las alternativas, 
los eventos, las probabilidades y los resultados de un problema de forma gráfica, lo 
que facilita su interpretación e implementación práctica [6]. Para construir un árbol de 
decisión se requiere [53]: 


1. La variable de respuesta debe ser cualitativa y estar acotada a un conjunto bien 
definido de categorías. 


2.  Lasobservaciones que se utilicen para construir el árbol ya deben estar asignados a 
una respectiva categoría, así como también deben ser vastos y diversos. 
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En la Figura 1 se muestra la representación gráfica de un árbol de decisión. Como se 
puede apreciar, por medio del árbol de decisión, se puede clasificar de forma ágil e 
intuitiva una observación en alguna de las categorías existentes. En el ejemplo de la 
Figura 1, si una empresa tiene ingresos menores a 50 u.m. y un patrimonio mayor a 
50 u.m., entonces se la categoriza como comprable; caso contrario, si el patrimonio 
es menor a 50 u.m., entonces es mejor no adquirirla. La facilidad de interpretación 
de los resultados es una de las ventajas que tiene esta herramienta matemática junto 
con el hecho que no asume ningún tipo de supuesto acerca de los datos usados para 
construirlo [6, 52, 531. 


Dentro de la terminología comunmente utilizada con los árboles de decisión se 
encuentran los siguientes conceptos [53]: 


+ Nodos: Los nodos son en un árbol de decisión aquellos elementos representados 
mediante figuras geométricas (cuadrados o círculos), que representan una 
decisión/pregunta que se debe tomar/contestar en esa instancia. Existen tres tipos 
de nodos en un árbol de decisión. 


Ingresos < 50 C 


Ingresos > 50 


Patrimonio < 50 Patrimonio > 50 


Patrimonio < 60 Patrimonio > 60 


e ) 


No comprar Comprar No comprar Comprar 


Figura 1: Árbol de decisión para comprar o no una empresa [6]. 


+ SsRama o sub-árbol: Es una porción específica del árbol de decisión que no 
necesariamente incluye al nodo raíz. 


Existen otros elementos que conforman un árbol de decisión, los cuales serán abordados 
con mayor detalle en la Sección Arbol de decisión para la quiebra empresarial. 


METODOLOGÍA 


En esta sección se presenta de forma detallada la metodología utilizada para abordar el 
problema de investigación y desarrollar el modelo de predicción de quiebra empresarial. 
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Características de la investigación 


Para el presente trabajo se ha definido la población de estudio como todas aquellas 
empresas domiciliadas en la ciudad de Machala, provincia de El Oro, activas en el 
año 2014, cuya actividad económica principal se categoriza dentro de la rama “A” 
correspondiente con el sector de “Agricultura, Ganadería, Silvicultura y Pesca”, conforme 
al código CIIU del Servicio de Rentas Internas del Ecuador (SRI). Para la obtención de 
los datos se utilizan fuentes secundarias, en particular, el portal de información de la 
Superintendencia de Compañías. 


La investigación tiene un enfoque cuantitativo de alcance correlacional debido a 
que se utiliza los indicadores financieros proporcionados por el agente regulador 
estatal (Superintendencia de Compañías), para ajustar un modelo estadístico para 
pronosticar la quiebra de las empresas y así determinar si existe una relación entre los 
indicadores financieros de una empresa y su posibilidad de quiebra. Adicionalmente, 
el diseño de la investigación es no experimental transversal debido a que se utiliza los 
datos del año 2014 para predecir la quiebra de una empresa cuatro años en el futuro, 
es decir en 2018. 


Obtención de los datos y pre-procesamiento 


Como se mencionó en la Sección Características de la investigación, la población de 
estudio está compuesta por todas las empresas domiciliadas en la ciudad de Machala 
que se encontraban activas en el año 2014 y que pertenecen a la rama económica “A” 
según la clasificación CIU del Servicio de Rentas Internas. Los indicadores financieros 
de estas compañías se obtuvieron del portal de información de la Superintendencia 
de Compañías. En total, la base de datos está compuesta por 311 empresas, de las 
cuales 239 seguían operando en el año 2018. La distribución de las empresas según su 
amaño es: 4 % empresas grandes, 35 % empresas medianas, 34 % empresas pequeñas 
y 27 % microempresas. Así mismo, la Superintendencia de Compañías proporciona la 
información de 20 indicadores financieros calculados a partir de los balances contables 
del año en cuestión. 


Para determinar si una empresa activa en el año 2014 seguía operando en el 2018 se 
omaron en cuenta dos condiciones: (1) que el RUC de la empresa esté considerado en el 
informe de indicadores financieros del 2018 y (2) que su situación legal establezca que la 
empresa aún está activa. Usando estas dos condiciones, se agregó la variable de respuesta 
a la base de datos, la cual nos indica si la empresa sigue o no operando en 2018, 


Selección de variables 


Uno de los principales factores que afectan negativamente el rendimiento de cualquier 
modelo estadístico es la correlación entre las variables que lo componen [54]. Por esta 
razón se calculó la matriz de correlación de los 20 indicadores financieros para determinar 
si existe o no dependencia lineal entre las variables predictoras. Como resultado de este 
análisis se eliminaron las siguientes variables de la base de datos: 


1 Para un mayor detalle sobre cómo se calculan los indicadores visitar https: //tinyurl.com/u75xjan 
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Prueba ácida 

Endeudamiento patrimonial 
Periodo Medio de Cobranza 
argen Bruto 

Endeudamiento del Activo Fijo 
Periodo Medio de Pago 

argen Operacional. 


e ol dl 


La eliminación de estas variables no se basó únicamente en el análisis de correlación, 
sino también en la dependencia con su contraparte. Por ejemplo, el análisis mostró 
que Liquidez corriente y Prueba ácida están correlacionadas. Según la metodología 
establecida por la Superintendencia de Compañías', para calcular la variable Prueba 
ácida se requiere de la variable Liquidez corriente, es decir, Prueba ácida depende de 
Liquidez corriente. Con este fundamento, se decidió eliminar Prueba ácida y mantener 
Liquidez corriente. Un análisis similar se realizó para las variables restantes. 


En la literatura existen otros métodos para seleccionar las variables predictoras que se 
incorporan en un modelo estadístico. Estos se basan ya sea en herramientas estadísticas 
o en herramientas de inteligencia artificial. El estudio de estos métodos está fuera del 
alcance del presente trabajo, el lector interesado puede consultar la referencia [55]. 


Una vez realizado el preprocesamiento de la base de datos, esta quedó conformada 
por 311 empresas y 13 indicadores financieros, así como también por la variable de 
respuesta que indica si la empresa sigue activa o no en el año 2018. 


Elección del método estadístico 


Como se pudo apreciar en la Sección Modelos de quiebra, existen varios métodos 
matemáticos para construir los modelos de predicción de quiebra empresarial. Según 
Alaka [36], los más utilizados son: 


. Redes neuronales artificiales (NN). 

. Support vector machines (SVM). 

« Árboles de decisión (DT). 

. Regresión logística (LR) 

. Análisis discriminante multivariado (MDA). 

De estos métodos, los dos primeros pertenecen al campo de la Inteligencia Artificial 
y los tres últimos al de la Estadística. En la Figura 2 se puede apreciar el rendimiento 
promedio que tienen estas herramientas a la hora de predecir la quiebra empresarial. 
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Figura 2: Precisión promedio de las herramientas de predicción de quiebra empresarial [36]. 


Como se puede apreciar, las redes neuronales alcanzan una precisión promedio de 
casi el 84 %, mientras que el análisis discriminante presenta el rendimiento más pobre 
con poco más del 78 %. Entre las herramientas estadísticas, la regresión logística y los 
árboles de decisión destacan en este aspecto. En el mismo estudio, Alaka [36] realiza 
un análisis comparativo exhaustivo del desempeño de los modelos de predicción de 
quiebra construidos con cada una de las herramientas mencionadas. En la Figura 3 
se puede apreciar que tanto los árboles decisión como la regresión logística tienen 
mejor rendimiento que el análisis discriminante multivariado. Hay que recordar 
que este último fue la herramienta escogida por Altman para desarrollar su famoso 
modelo Z-score. 


17% 
32% 
50% 50% 
83% 68% 


MOT HINA MO ma IS 


Figura 3: Porcentaje de estudios que muestran que una herramientas es más precisa que otra [36]. 


Finalmente, Alaka [36] también propone un marco metodológico para seleccionar la 
herramienta más adecuada para construir un modelo de predicción de quiebra. Entre 
los criterios a considerar para seleccionar dicha herramienta están: 
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. La facilidad de interpretación de los resultados, donde el árbol de decisión es 
superior, 


« Tipo de variables predictoras a considerar, pudiendo ser cuantitativas, cualitativas o 
ambas. Los árboles de decisión y la regresión logística pueden manejar ambos tipos, 
mientras que el análisis discriminante no lo hace. 


. Sensibilidad a la correlación, donde el árbol de decisión es el menos afectado. 


« Supuestos que deben cumplir los datos, donde una vez más el árbol de decisión se 
muestra como el más flexible. 


+ Tipo de relación entre las variables, donde la regresión logística exige que se 
relacionen por medio de una función logística, el análisis discriminante requiere 
relaciones lineales y el árbol de decisión no exige este tipo de supuesto. 


+ — Tamaño de muestra requerido, que en este caso todas las herramientas requieren 
que esta sea grande. 


Con base en los argumentos anteriores y en las características que posee la base de 
datos que se utiliza para construir el modelo de predicción de quiebra, la herramienta 
seleccionada para el presente trabajo es el árbol de decisión. 


MODELO DE PREDICCIÓN DE QUIEBRA PROPUESTO 


En esta sección se explica el desarrollo y construcción de un modelo de predicción 
quiebra empresarial para las empresas del sector agroindustrial de la ciudad de Machala 
basado en árboles de decisión. Se detalla la construcción del modelo, su interpretación, 
validación y mejora. Luego, se realiza un análisis de su rendimiento al compararlo con 
otros modelos propuestos en la literatura. Finalmente, como caso de aplicación, se 
utiliza el modelo propuesto para pronosticar, cuatro años en el futuro, la probabilidad de 
quiebra de las empresas que forman parte de la población de estudio que se encuentran 
activas en el año 2018, 


Árbol de decisión para la quiebra empresarial 


Tal como se mencionó en la Sección Árboles de decisión, los árboles de decisión son 
herramientas matemáticas bastante flexibles y simples pero a su vez potentes para 
la creación de modelos de clasificación y han mostrado ser una de las herramientas 
estadísticas con mayor precisión para el estudio de la quiebra empresarial [36]. Además 
tienen otras grandes ventajas tales como: 


. Es un método no paramétrico, por lo que no requiere realizar supuestos a priori 
sobre la distribución de probabilidad de los datos. 


. — Larepresentación gráfica del modelo que se obtiene es fácil de entender, interpretar 
y aplicar a nivel práctico. 
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Requiere menos preprocesamiento de los datos que otras técnicas estadísticas. 
Por ejemplo, no es sensible a la presencia de datos atípicos y no requiere la 
normalización de las variables. 


El tipo de las variables no es relevante. El árbol se puede construir considerando 
tanto variables cuantitativas como cualitativas. 


Debido a que en la base de datos que conforma la población de estudio se encontró la 
presencia de datos atípicos y por la escala de los valores se requeriría una normalización 
de estas, lo cual haría al modelo propuesto extremadamente dependiente de los datos 
utilizados, se decidió utilizar como técnica de modelado los árboles de decisión. 


Para 


a construcción del modelo de predicción de quiebra basado en árboles de 


decisión se consideró que cualquier modelo de clasificación requiere que se divida 
aleatoriamente la base de datos en un conjunto de entrenamiento y otro de validación. La 
práctica empírica sugiere tomar el 80 % de los datos para el conjunto de entrenamiento 
y el restante para la validación [38]. La idea detrás de esta división es que los datos del 
conjunto de entrenamiento se usen para la construcción del modelo y los de validación 
para determinar qué tan bien funciona el modelo propuesto cuando se lo utiliza para 
clasificar datos que no forman parte de la muestra, esto permite determinar qué tan 
generalizable es el modelo construido. 


Una 


vez separada la base de datos en un conjunto de entrenamiento y uno de 


validación, el árbol de decisión obtenido se muestra en la Figura 4. Este árbol fue 
construido usando el programa R considerando el 80 % de las 311 observaciones 
disponibles en la base de datos. Dentro de cada nodo se presenta la siguiente 
información: 


La etiqueta de clasificación que indica la categoría a la que debe asignarse cada 
empresa de la base de datos. Para el presente estudio, esta etiqueta presenta dos 
opciones: activa o inactiva. 


Las probabilidades a posteriori que indican la probabilidad de que la empresa 
pertenezca a dicha categoría al final del periodo de estudio. La probabilidad de la 
izquierda corresponde a la categoría de activa mientras que la de la derecha a la 
de inactiva. 


El porcentaje de la muestra que se encuentra contenida en dicho nodo. 
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ACTIVA 


1 


100% 
YES )-- ROTACIÓN DEVENTAS >= 1,3 


ACTIVA 


70,30 
51% 


ROTACIÓN DE ACTIVO FIJO >=0,81 


ENDEUDAMIENTO DEL ACTIVO < 1 


[26] 


ACTIVI 
65,35 
33% 


Figura 4. Árbol de decisión propuesto para la predicción de la quiebra empresarial 


Para interpretar el árbol de decisión (Ver Figura 4) se procede de la siguiente manera: 


+ Si 


la rotación de ventas de una empresa es mayor igual a 1,3, se avanza por la rama 


hacia la izquierda, donde inmediatamente se la clasifica como activa, con una 
probabilidad del 90 %. Es decir, si una empresa tiene una rotacion de ventas mayor 


(o) 


igual a 1,3, entonces tiene una probabilidad del 90 % de seguir activa cuatro años 


en el futuro. 


«Si 


ra 
ro 
al 

ro 


S 


a rotación de ventas de una empresa no es mayor o igual a 1,3, se avanza por la 
ma hacia la derecha llegando al nodo 3. Este nodo indica que una empresa cuya 
tación de ventas es menor a 1,3 tiene una probabilidad del 66 % de seguir activa 
final del periodo de estudio. En este nodo se realiza una nueva pregunta: ¿es la 
tación del activo fijo menor a 5,1? Si es así se avanza hacia el nodo 6, donde la 


probabilidad de que la empresa siga activa sube al 70 %. En este nodo se pregunta 


a rotación del activo fijo es mayor igual a 0,81. Si es así se avanza hacia el nodo 


12, donde se clasifica finalmente a la empresa como activa con una probabilidad 
del 89 %. En resumen, el árbol indica que una empresa con una rotación de 
ventas menor a 1,3 pero con una rotación del activo fijo entre 0,81 y 5,1 tiene una 
probabilidad de seguir activa del 89 %. 
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. Volviendo al nodo 3, si la rotación del activo fijo es mayor o igual a 5,1, entonces se 
avanza hacia la derecha al nodo 7, donde se clasifica a la empresa como inactiva 
con una probabilidad del 80 %. Es decir, una empresa con una rotación de ventas 
menor a 1,3 y con una rotación del activo fijo mayor a 5,1 tiene una probabilidad 
del 80 % de quebrar para el final del periodo considerado. 


De forma similar, se pueden interpretar los demás nodos del árbol de decisión. Una vez 
construido el árbol de decisión, es necesario verificar la calidad de este. Para esto se 
utiliza el segundo conjunto de datos que se separó de la muestra, es decir, el conjunto 
de validación. Cada empresa que forma parte de este conjunto es clasificada usando 
el modelo propuesto y se contrasta si la clasificación asignada por el árbol es la misma 
que la asignada por la realidad, es decir, se determina si el árbol asigna una empresa que 
sigue activa como activa y a una empresa inactiva como inactiva. Este procedimiento 
produce la matriz de validación que se muestra en la Tabla 2. 


Tabla 2: Matriz de validación del modelo propuesto 


Activa 


Inactiva 


Fuente: Elaboración propia 


En esta matriz se puede apreciar que de 48 empresas que estan activas en 2018, a 
todas ellas el árbol las clasifica como activas, es decir, tiene una precisión del 100 %. Sin 
embargo, de las 14 empresas que ya no se encuentran operando en 2018, solo a cuatro 
de ellas la clasifica correctamente, es decir, tiene una precisión del 28,57 %. De manera 
global, el árbol tiene una confiabilidad/precisión del 83,87 %. A pesar que el modelo 
propuesto tiene un alto nivel de confiabilidad (comparado con el 72 % del modelo de 
Altman [4])), su habilidad para clasificar las empresas inactivas es muy baja. Para arreglar 
este problema se consideró que en la construcción de modelos de clasificación los 
grupos deben estar balanceados, es decir, que la cantidad de empresas activas sea 
aproximadamente igual a la cantidad de empresas inactivas [38]. Como esto no se 
cumple para la base de datos actual (239 activas/72 inactivas), se tomó una muestra 
aleatoria de 72 empresas activas, logrando así el equilibrio entre las clases [56]. Como 
resultado, se obtuvo un nuevo árbol de predicción quiebra mostrado en la Figura 5. 


Para este nuevo modelo de predicción de quiebra, la matriz de validación se muestra 
en la Tabla 3. 


Tabla 3: Matriz de validación del modelo mejorado 


Activa Inactiva 


Activa 


Inactiva 


Fuente: Elaboración propia 
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Si bien la precisión del nuevo modelo desciende al 78,57 %, el poder predictivo para 
las empresas inactivas sube al 78,57 %, lo cual es una mejora sustancial con respecto 
al árbol inicial (28,57 %). Para interpretar este nuevo modelo de quiebra se procede de 
igual forma que para el modelo inicial. 


Análisis del rendimiento del modelo propuesto 


Uno de los principios fundamentales de la Estadística Inferencial establece que los 
resultados de un modelo estadístico son únicamente generalizables a la población 
de donde proviene la muestra con la cual se construyó dicho modelo [54]. Por lo 
anterior, es metodológicamente incorrecto tomar los modelos propuestos en la 
literatura y evaluarlos con la base de datos de este estudio. Sin embargo, por efectos de 
comparación, se toman los resultados reportados por los autores de dichos modelos en 


sus respectivos contextos. 
mM 
ACTIVA 
5050 
100% 


ROTACIÓN DE ACTIVO FIJO >= 0,48 os 


ye 


2 
ACTIVA 
ES 


ROTACIÓN DE ACTIVO FIJO < 4,7 Pa LIQUIDEZ CORRIENTE < 1,6 
A] 
qe 
ee 


IMPACTO GTO ADM, Y VENTAS < 0,092 APALANCAMIENTO FINANCIERO >= 3,6 APALANCAMIENTO >= 1 


Figura 5: Árbol de decisión mejorado para la predicción de la quiebra empresarial. 


Una de las medidas de desempeño más utilizadas para determinar la calidad de un modelo 
de clasificación es su precisión [38]. Si bien pueden existir otros indicadores, en el presente 
estudio se utiliza Únicamente la precisión por ser el valor que se reporta con frecuencia 
en los modelos de predicción de quiebra. En la Tabla 4 se reporta el rendimiento de los 
principales modelos de predicción de quiebra empresarial propuestos en la literatura en 
los últimos tres años, así como también el de los trabajos pioneros en esta área. En la 
última fila de dicha tabla se presenta la precisión alcanzada por el modelo propuesto en 
esta investigación. Los lectores interesados en un análisis comparativo exhaustivo de los 
modelos existentes en la última década pueden referirse a los trabajos [10, 36]. 
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Tabla 4: Precisión de modelos propuestos en la literatura 


Año Autor Herramienta Precisión 
1966 Beaver [34] UA? 76% 
1968 Altman [4] MDA 29% 
1980 Ohlison [35] LR 96% 
2018 Ayus [57] LR 70% 
2018 Svabova [58] DA 93% 
2019 Durica [59] DT 83% 
2019 Durica [60] LR 88% 
2019 Korol [61] DT 82% 
2020 Begovic [62] DT 98% 
2020 Shrivastava [63] LR 64% 
2020 Zorivcak [64] LSDA 76% 
2020 Nuestro modelo DT 79% 
Fuente: Elaboración propia 


Como se puede apreciar en la Tabla 4, la mayoría de los modelos de predicción de 
quiebra propuestos en la literatura tienen una precisión reportada superior al 70 %, en 
sus respectivos contextos. Esto tiene mucho sentido puesto que el modelo base de 
predicción de quiebra sería lanzar una moneda, lo que otorga una precisión básica del 
50 %. Con base en estos los resultados, el poder predictivo del modelo propuesto se 
encuentra dentro los estándares publicados en la literatura, por lo cual es un modelo 
con un rendimiento bastante aceptable dentro de su contexto. 


Aplicación del modelo para el ejercicio fiscal 2018 


En el portal de información de la Superintendecia de Compañías se encuentra 
disponible el informe de indicadores financieros para el ejercicio fiscal 2018, el cual 
considera únicamente las empresas activas en dicho año. Se debe indicar que el informe 
correspondiente al año 2019 no se encuentra disponible a la fecha de realización de 
esta investigación, puesto que las empresas entregan sus estados financieros durante 
el transcurso del siguiente ejercicio fiscal. Después de verificar la situación legal de las 
empresas en el reporte disponible, se constató que actualmente 28 de ellas ya no se 
encuentran activas, lo cual puede deberse a que su situación legal cambió después de 
la publicación del informe. 


Utilizando la base de datos del 2018 y después de eliminar las mismas variables 
correlacionadas indicadas en la sección Obtención de los datos y pre-procesamiento, se 
aplicó el modelo de predicción de quiebra propuesto en la Figura 5 obteniendo como 
resultado la Tabla 5. 
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Tabla 5: Pronostico para el ejercicio fiscal 2018 


Activa Inactiva 


Activa 


Inactiva 


Fuente: Elaboración propia 


De la Tabla 5 se puede concluir que el modelo tuvo una precisión del 82,14% al momento 
de clasificar una empresa inactiva como inactiva. Sin embargo, para las empresas que 
se encuentran actualmente operativas no se puede calcular esta precisión. Esto se debe 
a que no se puede conocer si las 245 empresas que el modelo clasifica como activas 
seguirán operativas cuatro años en el futuro. Por ahora, el modelo emite una alerta 
temprana para 190 de las compañías que se encuentran actualmente operando en el 
sector industrial competente a este trabajo de investigación. La información proporcio- 
nada por el modelo podría utilizarse como una guía para estudiar más a fondo la 
situación económica, financiera y comercial de estas compañías para orientarlas a que 
mejoren su productividad en caso de ser necesario. 


CONCLUSIONES Y TRABAJO FUTURO 


En el presente trabajo de investigación se construyó un modelo de predicción de quiebra 
empresarial para las empresas del sector agroindustrial domiciliado en la ciudad de 
Machala. Este se basa en los indicadores financieros del ejercicio fiscal 2014 para pronosticar 
la quiebra de una compañía cuatro años en el futuro (2018), por lo que el objetivo de 
este trabajo se cumplió. Tras realizar una revisión conceptual de las ventajas, desventajas y 
requisitos de diferentes técnicas cuantitativas para la generación de modelos predictivos, se 
seleccionó el árbol de decisión como la más adecuada para el contexto en estudio. Para la 
construcción del modelo de predicción de quiebra se consideró inicialmente una muestra 
de 311 empresas y 20 variables predictoras, la cual se redujo a un total de 144 empresas 
y 13 variables, Esto se hizo con la finalidad de obtener un conjunto de entrenamiento y 
validación adecuadamente balanceado entre empresas activas e inactivas. Con base en 
esto, se construyó el modelo de predicción de quiebra final el cual tiene un rendimiento/ 
precisión del 78,57 %, lo que lo ubica dentro de los ocho trabajos recientes con mejor 
precisión publicados en la literatura consultada del tema en cuestión. 


Adicionalmente a un buen rendimiento del modelo construido, también se obtuvieron 
otros resultados interesantes en el estudio de la quiebra en la población objetivo. Para 
clasificar aquellas empresas que seguirán activas cuatro años en el futuro, el modelo 
propuesto arrojó que los indicadores financieros más relevantes son: 


1. Rotación del Activo Fijo, definido como la eficiencia que la organización tiene en el 
uso de sus activos fijos para generar ventas de sus productos o servicios. Según los 
resultados arrojados por el modelo, este indicador debe de oscilar entre 0,48 y 4,7, 
lo que revela una adecuada proporción entre los ingresos por ventas y la inversión 
en planta y equipo. 
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2. Impacto de Gastos Administrativos y de Ventas, referido como los gastos 
operacionales y administrativos que se deben incurrir para que la empresa funcione. 
Estos gastos pueden mermar fuertemente el crecimiento de una organización, 
por lo cual el modelo refiere que a menor valor de este indicador, menor es la 
probabilidad de quebrar en el futuro. 


3. Endeudamiento del Activo, considerado como el nivel de autonomía financiera 
que tiene una empresa. Mientras menor sea este indicador, más solvencia 
financiera tiene. Este es el tercer indicador más relevante en la predicción de la 
supervivencia empresarial. Las organizaciones que tienen un alto impacto de 
gastos en administración y ventas pero un bajo endeudamiento del activo tienen 
muchas más posibilidades de seguir operando en el futuro que aquellas que no. 


Como conclusión, los indicadores financieros que determinan la supervivencia de 
una empresa agroindustrial cuatro años en el futuro, según los resultados del modelo 
propuesto son: una rotación del activo fijo entre 0,48 y 4,7, un impacto de gastos en 
administración y ventas menor a 0,092 y un endeudamiento del activo menor a 0,79. De 
manera similar, los indicadores financieros más relevantes que vaticinan la quiebra de 
una empresa de la población objetivo son: 


1. Liquidez corriente, referida como la capacidad que tiene la empresa de cubrir sus 
obligaciones en el corto plazo. Si este indicador es mayor a 1,6 (según el modelo 
propuesto), esto posiblemente indica un mal manejo de los activos, es decir, un 
exceso de liquidez poco productiva. 


2.  Apalancamiento, definido como el grado de utilización del propio patrimonio de 
la empresa. Si este indicador es mayor a 1, significa que la empresa está generando 
utilidades, caso contrario está a pérdida. 


3.  Apalancamiento financiero, que indica si es rentable o no el endeudamiento con 
terceros. En el caso de la población objetivo, para que la empresa sobreviva, este 
indicador debe ser superior a 3,6, caso contrario la probabilidad de quiebra es del 
80 % en cuatro años. 


Como conclusión se obtiene que los indicadores que determinan la quiebra de una 
empresa agroindustrial en la población de estudio, según el modelo propuesto son: 
una liquidez corriente mayor a 1,6, un apalancamiento menor a 1 y un apalancamiento 
financiero inferior a 3,6. 


Finalmente, como trabajo futuro se pueden estudiar otras herramientas matemáticas 
para la construcción de esta clase de modelos de tal forma que se pueda aumentar 
su confiabilidad, así como también la incorporación de otras variables en el estudio. 
Por ejemplo, el modelo propuesto se basa únicamente en los indicadores financieros 
calculados para cada una de las empresas que componen la base de datos. No considera 
variables externas tales como la participación de mercado, efectos de las medidas micro 
y macro-económicas que se tomen en el país o en la provincia, entre otros. Sin embargo, 
a pesar de no considerar estos factores, el modelo cuenta con un nivel de confiabilidad 
aceptable comparado con otros modelos propuestos en la literatura reciente. 
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